7 de noviembre de 2019
Distribución de empresas inscritas según provincia, Gran Área Metropolitana, Costa Rica
mod1<-lm(log(venta_diaria)~1, data = microempresas_data) summary(mod1)
Call:
lm(formula = log(venta_diaria) ~ 1, data = microempresas_data)
Residuals:
Min 1Q Median 3Q Max
-2.48204 -0.36056 0.07743 0.40834 0.90235
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.6924 0.0153 764.1 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.5591 on 1334 degrees of freedom
mod5<-lm(log(venta_diaria)~dist_centro, data = microempresas_data) summary(mod5)
Call:
lm(formula = log(venta_diaria) ~ dist_centro, data = microempresas_data)
Residuals:
Min 1Q Median 3Q Max
-2.48891 -0.35350 0.05933 0.41906 1.09174
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.776966 0.025940 454.009 < 2e-16 ***
dist_centro -0.016251 0.004036 -4.026 5.98e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.5559 on 1333 degrees of freedom
Multiple R-squared: 0.01202, Adjusted R-squared: 0.01127
F-statistic: 16.21 on 1 and 1333 DF, p-value: 5.985e-05
anova(mod1, mod5)
Analysis of Variance Table
Model 1: log(venta_diaria) ~ 1
Model 2: log(venta_diaria) ~ dist_centro
Res.Df RSS Df Sum of Sq F Pr(>F)
1 1334 416.98
2 1333 411.97 1 5.0102 16.211 5.985e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se prefiere el modelo con únicamnete el intercepto.
model psill range 1 Nug 0.2459544 0.000000 2 Bes 0.1226058 8.174145
Usando el criterio del radio de \(\dfrac{nugget}{rango}\) (\(\dfrac{0.24}{0.36}=0.66\))
Es decir, existe una relación espacial moderada
Interpolación de ventas para la GAM
La cercanía al centro urbano no es una buena variable para explicar el proceso estócastico de las ventas diarias de estas empresas, otras variables, como tiempo de permanencia en el mercado o númerode empleados.
La transformaciones escogidas para las variables utilizadas no permitieron solucionar los problemas de linealidad.
Al obtener un coeficiente de determinación tan bajo (inferior a 10%), indica que el modelo nulo no es adecuado y nuevas covariables tienen que investigarse para mejorar estos resultados.
La interpolación realizada captura bien la distribución de las ventas en la GAM, sin embargo, al no estar usándose ninguna covariable, no es posible predecir valores de ventas para lugares con poca muestra como lo es la provincia de Cartago.